home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / ietf / urn / urn-archives / urn-ietf.archive.9610 / 000115_owner-urn-ietf _Fri Oct 25 14:28:12 1996.msg < prev    next >
Internet Message Format  |  1997-02-19  |  4KB

  1. Received: (from daemon@localhost) by services.bunyip.com (8.6.10/8.6.9) id OAA00247 for urn-ietf-out; Fri, 25 Oct 1996 14:28:12 -0400
  2. Received: from mocha.bunyip.com (mocha.Bunyip.Com [192.197.208.1]) by services.bunyip.com (8.6.10/8.6.9) with SMTP id OAA00242 for <urn-ietf@services.bunyip.com>; Fri, 25 Oct 1996 14:28:10 -0400
  3. Received: from josef.ifi.unizh.ch by mocha.bunyip.com with SMTP (5.65a/IDA-1.4.2b/CC-Guru-2b)
  4.         id AA07369  (mail destined for urn-ietf@services.bunyip.com); Fri, 25 Oct 96 14:28:05 -0400
  5. Received: from ifi.unizh.ch by josef.ifi.unizh.ch 
  6.           id <00862-0@josef.ifi.unizh.ch>; Fri, 25 Oct 1996 20:27:12 +0100
  7. Subject: Re: [URN] Unicode for NSS query
  8. To: masinter@parc.xerox.com (Larry Masinter)
  9. Date: Fri, 25 Oct 1996 20:27:11 +0100 (MET)
  10. Cc: urn-ietf@bunyip.com
  11. In-Reply-To: <96Oct24.182227pdt."2763"@golden.parc.xerox.com> from "Larry Masinter" at Oct 24, 96 06:22:27 pm
  12. Mime-Version: 1.0
  13. Content-Type: text/plain; charset=US-ASCII
  14. Content-Transfer-Encoding: 7bit
  15. Content-Length: 2336
  16. From: Martin J Duerst <mduerst@ifi.unizh.ch>
  17. Message-Id: <"josef.ifi..655:25.09.96.19.27.19"@ifi.unizh.ch>
  18. Sender: owner-urn-ietf@services.bunyip.com
  19. Precedence: bulk
  20. Reply-To: Martin J Duerst <mduerst@ifi.unizh.ch>
  21. Errors-To: owner-urn-ietf@bunyip.com
  22.  
  23. Larry Masenter wrote:
  24.  
  25. >The way that i think of this is that the constraints:
  26. >
  27. >1 'has a unique sequence of octets that can be unambiguously interpreted by a
  28. >  system'
  29. >
  30. >2 'has a unique sequence of glyphs that can be unambiguously displayed
  31. >  and subsequently entered by a user'
  32. >  
  33. >cannot be mutually satisfied. The simplest way to think about this is
  34. >to have two kinds of representations of URNs: as a canonical sequence
  35. >of octets, and as a user-entered string. Every URN has a single
  36. >canonical representation, and the user entry method must map it to the
  37. >canonical representation. No embedded URN-as-protocol-element should
  38. >require canonicalization. The protocol for 'canonicalizing' a name may
  39. >not be the same as the protocol for 'resolving' a name or asking for
  40. >information about it.
  41.  
  42. Larry, I have some difficulties understanding you. By user-entered
  43. string, do you mean the stuff on the cardboard box, and maybe the
  44. pixels on the screen that the user sees when typing it in? Or do
  45. you mean some kind of represenation that is moved around inside
  46. the computer?
  47.  
  48. And why do you think that the two cannot be mutually satisfied?
  49. It works for ASCII, anyway. For some other scripts, it is a little
  50. bit more difficult, but some of these problems are similar to
  51. what we have currently when somebody confuses "O" and "0" or
  52. "l" and "1" and "I", and others, such as the A-grave case,
  53. could be defined by normalization, which would also be required
  54. for deriving your "canonical representation".
  55.  
  56. The problem of embedding is of course a tough one. One way to
  57. interpret your statement is that it means that e.g. in an HTML
  58. document, URL/Ns would only appear in the %HH notation (because
  59. arbitrary octets would not usually pass the SGML parser).
  60. This would indeed be rather restricting. I could easily immagine
  61. that a Japanese document author constructs a document encoded
  62. in SJIS, and just writes down a Japanese URL/N from the cardbord
  63. box as is. It would technically be no problem for the browser
  64. to take this URL/N, interpret it as SJIS, convert it to UTF-8,
  65. maybe normalize it, and then pass it to some resolving mechanism.
  66.  
  67. If you see some problems with this, please tell me. If you don't
  68. want to call the visible (e.g. in SJIS) form an URL/N, I can
  69. accept that, but users will soon call it that way anyway.
  70.  
  71. Regards,    Martin.